Métodos Quantitativos Aplicados à Ciência Política
Mostrar os dados
Induzir o observador a pensar em sua substância, não em metodologia ou tecnologia de produção
Evitar distorcer o que os dados dizem
Apresentar muitos números em pequenos espaços
Tornar grandes conjuntos de dados coerentes
Encorajar o observador a comparar diferentes partes dos dados
Revelar diferentes níveis de detalhamento dos dados
Servir a um propósito claro e razoável: descrição, exploração, tabulação ou decoração
Estar integrada com as descrições estatísticas e verbais do conjunto de dados
Miniaturas Múltiplas
Menor diferença efetiva
Causalidade (Respondendo a pergunta: “Comparado com o quê?”)
Contexto
Andrew Abela Chart chooser
Seguir princípios de design pode ajudar a aumentar a qualidade das visualizações:
- Gerando apresentação eficaz de informações
- Evitando distração e confusão, reduzindo a carga cognitiva
- Agregando valor estético
Alguns princípios selecionados
Proporção dados-tinta (data-ink ratio)
Densidade de dados (data density)
Heurística de cores (color heuristics)
Lixo gráfico (chartjunk)
Boas representações gráficas maximizam data-ink e minimizam, tanto quanto possível, non-data-ink.
A densidade de dados de um gráfico é a proporção do tamanho total do gráfico dedicado à exibição de dados. (Tufte, 1983)
Semelhante ao Data-Ink Ratio, Tufte prefere visualizações com alta densidade de dados.
Ele afirma que a maioria dos gráficos pode ser reduzida sem perder legibilidade ou informações.
Contraste e analogia são os princípios que definem o design de cores.
As cores contrastantes são diferentes, as cores análogas são semelhantes.
O contraste chama a atenção, a analogia agrupa.
As informações codificadas por cores devem ser legíveis.
O que você quer mostrar?
Elementos que podem destacar ou confundir o que você quer mostrar.
vamos tentar alternar “teoria” com live code
Ah, mas eu posso usar base R? Poder, pode…
Dados (data =)
Geometrias (geom_)
Estéticas (aes())
Escalas (estética) (scale_)
Escalas (eixos) (scale_x)
Tema
Facet
data =Dado empilhado?
Cada coluna será uma entrada!
geom_geom_tipo_de_geometria
Recursos +
aes()x (xmax e xmin)
y(ymax e ymin)
color
fill
shape
group
size
scale_scale_color_xx
scale_fill_xx
scale_shape_xx
scale_xContínua scale_x_continuous
Discreta scale_x_discrete
Tempo scale_yearmon
Série de tempo zooe lubridate –> scale_yearmon
Customização total da visualização
Eixos
Texto element_text
linhas de grade
facet_grid
facet_wrap
Gráficos com interatividade:
Combinação de gráficos
Lembram as bases de bancadas e coligações que usamos para fazer o join?
Agora vamos criar um gráfico de barras com:
o tamanho das bancadas como tamanho das barras e
colorindo de acordo com o presidente que apoiam
Live coding brincando com camadas no objeto g.colig
Carregue os dados de exemplo do pacote survey data(api), use o data.frame apisrs
Crie o objeto tbl_svy com o nome amostra_expandida expandindo a amostra aleatória simples usando apenas a variável (coluna) “pw”, contendo o peso amostral. Dica: execute as_survey(weight=pw).
Usando a variável stype crie uma nova variável indicando se a escola é de nível fundamental (categorias E e M de stype) ou de nível médio (categoria H de stype). Dica: use mutatee case_when.
Faça um gráfico de barras comparando a variação média das notas de 1999 (api99) e 2000 (api00) por nível e utilize as estimativas intervalares. Dica: olhe o código da aula 07, utilize geom_errorbar para a estimativa intervalar.
Capítulo livro: Identity Versus Fear of Death: Political Polarization Under the COVID-19 Pandemic in Brazil
Paper APSA 2022: Fried, broiled, smoked: pork is all everybody loves: The allocation of pork to where it is needed?
IPOL/UnB